AI资讯新闻榜单内容搜索-AI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI
3B模型性能小钢炮,“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab&澳门大学

3B模型性能小钢炮,“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab&澳门大学

3B模型性能小钢炮,“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab&澳门大学

当大模型把人类曾经的终极考题变成日常练习,AI的奔跑却悄悄瘸了腿—— 训练能力突飞猛进,验证答案的本事却成了拖后腿的短板。 为此,上海AI Lab和澳门大学联合发布通用答案验证模型CompassVerifier与评测集VerifierBench。填补了Verifier领域没有建立验证->提升->验证的循环迭代体系的空白。

来自主题: AI技术研报
7262 点击    2025-08-09 11:11
4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉

4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉

4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉

备受 AI 圈关注的首届谷歌 Kaggle AI Chess 大赛(也即大模型国际象棋对抗赛)迎来了最终赢家。就在昨天,Grok 4 携手 OpenAI o3 进入了决赛。在机器之心的投票中,大家更倾向于 o3 战胜 Grok 4。

来自主题: AI资讯
9186 点击    2025-08-09 10:05
从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐

从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐

从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐

当前,大型语言模型(LLM)在软件工程领域的应用日新月异,尤其是在自动修复 Bug 方面,以 SWE-bench 为代表的基准测试展示了 AI 惊人的潜力。然而,软件开发远不止于修 Bug,功能开发与迭代才是日常工作的重头戏。

来自主题: AI技术研报
7577 点击    2025-08-08 17:01
a16z 投资人最高频使用的 10 个 AI 产品

a16z 投资人最高频使用的 10 个 AI 产品

a16z 投资人最高频使用的 10 个 AI 产品

世界顶级风投 a16z 这两年已经成为全球最活跃AI投资者,他们对于行业的判断非常准确。我在 X 上关注了很多 a16z 的投资人,这样能方便第一时间了解行业最新的趋势是什么,以及有哪些我没注意到的好 AI 应用。

来自主题: AI资讯
9896 点击    2025-08-08 14:21
2025 硅谷 AI 战局半年盘点:连环收购案、大厂抢人,谁能杀出重围?|对谈 Fusion Fund 创始合伙人张璐

2025 硅谷 AI 战局半年盘点:连环收购案、大厂抢人,谁能杀出重围?|对谈 Fusion Fund 创始合伙人张璐

2025 硅谷 AI 战局半年盘点:连环收购案、大厂抢人,谁能杀出重围?|对谈 Fusion Fund 创始合伙人张璐

对大公司来说,钱不值钱,最值钱的是时间。本期播客,我们邀请在硅谷专注 AI 企业级应用、医疗和工业自动化早期投资的风险投资机构 Fusion Fund 创始合伙人张璐,梳理上半年硅谷的科技大事件,以及从 Windsurf 收购案入手,分析这件事折射出了硅谷的初创生态在发生的变化,以及从 Meta 到 Google、再到苹果、亚马逊、微软,上半年的一些关键动作意味着哪些战略选择。

来自主题: AI资讯
7288 点击    2025-08-08 13:48
5年打造1800万「新老人」AI 社交场:梨花教育如何破局?

5年打造1800万「新老人」AI 社交场:梨花教育如何破局?

5年打造1800万「新老人」AI 社交场:梨花教育如何破局?

当老年大学还在“唱歌跳舞”,AI 教练已用“彩虹夸夸术”,点亮1800万会员的新生活。

来自主题: AI资讯
7723 点击    2025-08-08 12:49
AI 科普丨都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例

AI 科普丨都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例

AI 科普丨都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例

近一年来,围绕人工智能(AI)、生成式 AI(GenAI)和大语言模型(LLM)的炒作愈演愈烈,大众的兴趣翻了一番,针对 AI 的投资激增,各国政府也采取了更加明确的立场。根据一些人的说法,AI 与人类的未来息息相关。

来自主题: AI资讯
7267 点击    2025-08-08 12:41
云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利

云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利

云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利

昨天是个热闹的日子,OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型:前者是自 GPT-2 以来重新开源的两款模型 gpt-oss(120b 和 20b),后者是 Claude 系列最强的 Opus 4.1。

来自主题: AI资讯
8401 点击    2025-08-08 12:26
颠覆互联网的下一波浪潮:Agentic Web来了!

颠覆互联网的下一波浪潮:Agentic Web来了!

颠覆互联网的下一波浪潮:Agentic Web来了!

过去三十年,互联网经历了从静态网页到智能推荐的深刻演变。如今,我们正站在互联网的另一个重大转折点上。 这一转折,来自一种全新的范式设想 —— Agentic Web,一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中,用户不再手动浏览网页、点击按钮,而是通过自然语言向智能体发出一个目标,AI 会自主规划、搜索、调用服务、协调其他智能体,最终完成复杂任务。

来自主题: AI技术研报
8539 点击    2025-08-08 12:03